2025-02-18 16:55:26.AIbase.
OpenAI lanza el benchmark SWE-Lancer: evaluación del rendimiento de los modelos en trabajos de ingeniería de software freelance reales
2024-08-15 14:53:25.AIbase.
OpenAI lanza SWE-bench Verified: Mejora la evaluación de la capacidad de ingeniería de software de la IA
2023-08-10 10:09:18.AIbase.